Vamos começar essa aula discutindo o Exercício 3 do HW 4 (se não fez, tente fazer)
Perceba que a hipótese alternativa (\(H_A\)) é de que o valor do QI será diferente da distribuição conhecida. Não se assume que ele será maior ou menor. Portanto, precisamos “apostar” nas duas caudas da distribuição.
Perceba que \(\alpha\) e \(p\) são duas coisas diferentes.
\(\alpha\): quão extremo deverá ser um valor para eu rejeitar a \(H_0\) a favor de uma \(H_A\); definido antes das análises.
p-valor: quão extremo é o valor observado considerando que \(H_0\) seja verdadeira.
Hypothesize
After the
Results are
Known
HARKing é como chamamos a situação em que o cientista começa a brincar com os dados até achar um resultado significativo, fazendo hipóteses e testes que não estavam em sua hipótese inicial e reportando como se o achado fosse sua hipótese prévia.
O problema com o HARKing é que ele leva a conclusões que dificilmente são replicadas posteriormente, pois o experimento não foi feito para investigar aquela questão específica.
Fazer HARKing é como desenhar um alvo depois de ter atirado o dardo: você dificilmente vai conseguir acertar aquele alvo novamente.
Infelizmente o HARKing é uma prática comum, e muitos cientistas não veem problemas em conduzir suas análises dessa maneira.
Se você algum dia quiser conduzir análises que não estavam previstas no seu desenho experimental, chame-as pelo nome: análise post-hoc.
Os achados de análises post-hoc devem ser vistos com cautela.
Quando fazemos um teste de hipótese, estamos nos perguntando se temos evidências para rejeitarmos a Hipótese Nula (\(H_0\)).
Para isso, calculamos a probabilidade de um determinado valor ocorrer em um distribuição.
O z-score é uma maneira de calcular essa probabilidade a partir da Distribuição Normal Padrão.
Precisamos pensar nas nossas análises antes de realizarmos nossas coletas ou desenharmos nossos experimentos.
Quando fazemos um estudo, temos que pensar na nossa POPULAÇÃO e na nossa AMOSTRA.
Geralmente selecionamos uma AMOSTRA representativa da população para poder generalizar os nossos dados.
Eu quero saber as intenções de votos da população brasileira. Como posso investigar?
Eu quero saber se os brasileiros estão deixando de fazer concordância nominal de número. Como posso investigar?
Eu quero saber se quem aprende inglês com video-games chega ao mesmo nível de proficiência de quem faz curso específico. Como investigar?
Eu quero saber se o processamento de uma palavra é influenciado por sua probabilidade de ocorrência em um contexto. Como investigar?
Em todos os casos, não tenho como coletar os dados da minha população. Por isso, seleciono uma amostra representativa.
Se eu não consigo uma amostra representativa e seleciono uma amostra de conveniência, preciso ter cuidado ao generalizar os meus dados e ter consciência de qual população estou represtando ali.
No geral, analisamos as estatísticas de uma amostra para estimar os parâmetros de uma população.
Até agora, aprendemos a descrever amostras (ou populações) com o que chamamos estatística descritiva.
Usar as estatísticas de uma amostra para estimar os parâmetros de uma população é uma das maneiras de fazer inferência estatística.
Hinton (2014)
Uma cidade é afetada pelo vazamento de um componente químico. Um médico acha que isso tem afetado o nascimento de bebês da cidade, fazendo com que eles nasçam menores.
Como testar a hipótese? Como você escreveria essa hipótese em termos de hipótese nula e hipótese alternativa?
Teste: comparar uma amostra do peso ou altura de bebês afetados com a população de bebês que nascem nos Estados Unidos.
\(H_0\): a distribuição do peso de bebês afetados pertence a distribuição de peso dos bebês nascidos nos EUA
\(H_A\): a distribuição do peso de bebês afetados tem valores menores que a distribuição de peso dos bebês nascidos nos EUA
Vamos dar uma olhada na população.
N = 3.954.875 nascimentos
\(\mu\) = 3.2kg
\(\sigma\) = 0.9.
Vamos dar uma olhada na amostra.
\(n\) = 100
\(\bar{X}\) = 3.0kg
s = ? (*Hinton não dá essa informação, eu inventei uma só para poder gerar o histograma)
Que informação dos dois conjuntos (população e amostra) eu posso comparar para investigar a questão?
R: A média.
É possível comparar a média da amostra e a média da população?
R: Não podemos fazer essa comparação diretamente, pois é possível que, por acaso, eu tenha selecionado 100 bebês que calharam de ser menores.
Solução –> posso mudar minha pergunta e me questionar o seguinte: se eu selecionar amostras aleatórias de 100 bebês da minha população, quão provável seria ter uma amostra com média igual a 3.0kg?
Eu posso selecionar várias amostras de uma população e fazer um histograma que mostre a distribuição dessas médias.
Podemos fazer isso no site http://onlinestatbook.com/stat_sim/sampling_dist/index.html
ATENÇÃO: o site contém imagens fortes de matemágica
Voltemos à nossa pergunta: quão provável seria ter uma amostra com média igual a 3.0kg?
R: Ver a probabilidade acumulada do valor 3.0kg na D.A.M. da população, considerando que essa distribuição foi feita a partir de amostras cujo \(n\) = 100
\[ z =\frac{\bar{X}-\mu_\bar{X}}{\sigma_\bar{X}} =\frac{\bar{X}-\mu}{\frac{\sigma}{\sqrt{n}}} =\frac{3-3.2}{\frac{0.9}{\sqrt{100}}} =\frac{-0.2}{0.09} = -2.22 \]
Voltemos à nossa pergunta: quão provável seria ter uma amostra com média igual a 3.0kg?
Como investigar? R: Ver a probabilidade acumulada do valor 3.0kg na D.A.M. da população, considerando que essa distribuição foi feita a partir de amostras cujo \(n\) = 100
\[ z =\frac{\bar{X}-\mu_\bar{X}}{\sigma_\bar{X}} =\frac{\bar{X}-\mu}{\frac{\sigma}{\sqrt{n}}} =\frac{3-3.2}{\frac{0.9}{\sqrt{100}}} =\frac{-0.2}{0.09} = -2.22 \]
pnorm(-2.22, lower.tail = T)## [1] 0.01320938
Considerando \(\alpha\) = 0.05, podemos rejeitar a \(H_0\)
Uma empresa ensaca cafés afirmando que cada saco tem 500g. A empresa também informa que o maquinário que produz o conteúdo deve retornar esse valor com \(\sigma\) = 25g.
Uma amostra de 30 pacotes é analisada pelo controle de qualidade, e a média de peso dessa amostra é de 513g. O gerente de produção quer testar se a máquina tem produzido pacotes com um peso maior que o esperado.
Assumindo um \(\alpha\) = 0.05, é possível afirmar que a amostra recolhida indica que o maquinário está produzindo pacotes com média superior ao valor pretendido?
Que populações e amostras temos?
Próximo passo: construir minhas hipóteses e definir se é possível rejeitar \(H_0\) com \(\alpha\) = 0.05.
\(H_0\): A amostra vem da distribuição conhecida; \(\mu\) = \(\bar{X}\).
\(H_A\): A amostra vem de uma distribuição com valores maiores que os da distribuição conhecida; \(\mu\) < \(\bar{X}\).
\[ z =\frac{\bar{X}-\mu_\bar{X}}{\sigma_\bar{X}} =\frac{\bar{X}-\mu}{\frac{\sigma}{\sqrt{n}}} =\frac{513-500}{\frac{25}{\sqrt{30}}} =\frac{13}{1.82} = 2.84 \]
pnorm(2.84, lower.tail = F)## [1] 0.002255677
Conclusão 1: parece pouco provável que a média da amostra tenha vindo dos valores extremos da upper tail da distribuição amostral das médias da população.
Conclusão 2: rejeitamos a hipótese nula (considerando \(\alpha\) = 0.05).
Uma escola investiu numa nova técnica de ensino de redação de forma experimental. Durante um ano, uma turma de 30 alunos selecionados aleatoriamente dentre os alunos do terceiro ano tiveram aulas com essa nova técnica.
Ao fim do ano, a média dessa turma na prova de redação do ENEM foi de 698. A média do restante dos alunos foi 650, com desvio-padrão de 25.
Considerando um alfa de 0.05, pode-se rejeitar a \(H_0\)?
Lembre-se: \[ z = \frac{\bar{X}-\mu}{\frac{\sigma}{\sqrt{n}}} \]
\(H_0\): \(\mu\) = \(\bar{X}\)
\(H_A\): \(\mu\) < \(\bar{X}\)
media.populacao = 650
media.amostra = 698
sd.populacao = 25
n.amostra = 30
z = (media.amostra-media.populacao)/(sd.populacao/sqrt(n.amostra))
z## [1] 10.51627
pnorm(z, lower.tail = F)## [1] 3.634616e-26
Rejeito \(H_0\) com \(\alpha\) = 0.05
Há situações em que eu tenho uma população e uma amostra, e me questiono se aquela amostra pode ter vindo daquela população.
Assumo a \(H_0\) de que a média da amostra vem da distribuição das médias amostrais da população.
Analiso, com o z-score, se é possível rejeitar a \(H_0\) de acordo com meu \(\alpha\).
O importante aqui é notar que, mais uma vez, estamos calculando probabilidades, ainda que tenhamos dado um passo além ao calcular a probabilida de ocorrência da média de uma amostra em meio à distribuição amostral das médias, e não apenas a probablidade de ocorrência de um valor qualquer da amostra
O teste-t é o tipo de teste que fazemos quando queremos fazer um teste de hipóteses envolvendo uma ou duas amostras.
Em vez de usar o desvio-padrão da população, \(\sigma\) usa-se o desvio-padrão da amostra, \(s\). Isso nos dará uma estatística t em vez de uma estatística z. Vejamos:
No caso do R, a fórmula sd() já retorna, na verdade, o \(s\) de um vetor. Ou seja, já estávamos considerando o desvio-padrão amostral.
Confira isso usando o help do R com o comando ?sd
Não se preocupe com o cálculo do \(s\). Apenas lembre que ele é feito com base em degrees of freedom (df), ou graus de liberdade, que correspondem a n-1. Entenderemos a relevância de degrees of freedom em outro momento.
O teste-t assume uma distribuição t, que varia de acordo com seu grau de liberdade - que, por sua vez, é influenciado em grande parte pelo \(n\).
Como vimos, quanto maior o \(n\), menos “espalhada” é a distribuição.
O tamanho da amostra coloca algumas questões interessantes. Por exemplo, qual é a probabilidade acumulada de t = -2?
Tente calcular com a função pt(-2), do mesmo jeito que usamos a função pnorm().
pnorm(-2)## [1] 0.02275013
pt(-2)## Error in pt(-2): argument "df" is missing, with no default
pt(-2, df = 2)## [1] 0.09175171
pt(-2, df = 6)## [1] 0.04621316
pt(-2, df = 30)## [1] 0.02731252
pt(-2, df = 100)## [1] 0.02410609
Graus de liberdade são um parâmetro que deve ser informados para o cálculo de uma estatística t (do teste T de Student).
A origem do teste t tem a ver com um químico - William Gosset - tentando descobrir quantas amostras eram necessárias para avaliar a qualidade de um lote de cerveja Guiness
Até pela sua origem, o teste-t é um teste muito associado a controle de qualidade. Considere a seguinte situação:
Um gerente de produção quer ter certeza de que sua fábrica tem produzido pacotes com 500g de café. Para isso, ele anota o peso de uma amostra de 15 pacotes.
Ele quer saber o seguinte: se minha população tem média igual a 500 (a população de pacotes de café que eu quero produzir), qual a probabilidade de eu selecionar uma amostra como a que tenho abaixo? Como minha distribuição é normal, posso me perguntar: quão extrema na cauda inferior ou superior seria a média da minha amostra na distribuição amostral das médias de uma população de média igual a 500?
cafe = c(501, 506, 499, 490, 491, 493, 490, 497, 498, 488, 515, 494, 497, 504, 504)
mean(cafe)## [1] 497.8
\[ t = \frac{\bar{X}-\mu}{\frac{s}{\sqrt{n}}} \]
Vamos anotar os valores:
media.amostra = mean(cafe) #média da amostra
media.padrao = 500 #média pretendida
s = sd(cafe) #desvio-padrão amostral (s)
n = length(cafe) #número de observações da amostra\[ t = \frac{\bar{X}-\mu}{\frac{s}{\sqrt{n}}} \]
t = (media.amostra-media.padrao)/(s/sqrt(n))
t## [1] -1.160731
pt(t, df = n-1, lower.tail = F) #Probabilidade acumulada na upper-tail## [1] 0.8674191
pt(t, df = n-1, lower.tail = T) #Probabilidade acumulada na lower-tail ## [1] 0.1325809
Há um jeito mais fácil de fazer um teste-t com uma amostra no R
t.test(cafe, mu=500, alternative = "greater") #Ha: média da amostra é maior que 500##
## One Sample t-test
##
## data: cafe
## t = -1.1607, df = 14, p-value = 0.8674
## alternative hypothesis: true mean is greater than 500
## 95 percent confidence interval:
## 494.4617 Inf
## sample estimates:
## mean of x
## 497.8
Dado que \(H_0\) seja verdadeira, a probabilidade de tirar um valor tão ou mais extremo na cauda superior é 0.86.
Há um jeito mais fácil de fazer um teste-t com uma amostra no R
t.test(cafe, mu=500, alternative = "less") #Ha: média da amostra é menor que 500##
## One Sample t-test
##
## data: cafe
## t = -1.1607, df = 14, p-value = 0.1326
## alternative hypothesis: true mean is less than 500
## 95 percent confidence interval:
## -Inf 501.1383
## sample estimates:
## mean of x
## 497.8
Dado que \(H_0\) seja verdadeira, a probabilidade de tirar um valor tão ou mais extremo na cauda inferior é 0.13.
Vamos relembrar a questão: o gerente quer saber se a média da amostra é igual ou diferente de 500
\(H_0\) = a média da amostra é igual a 500g
\(H_A\) = a média da amostra é diferente de 500g (maior OU menor)
t.test(cafe, mu=500, alternative = "two.sided")##
## One Sample t-test
##
## data: cafe
## t = -1.1607, df = 14, p-value = 0.2652
## alternative hypothesis: true mean is not equal to 500
## 95 percent confidence interval:
## 493.7349 501.8651
## sample estimates:
## mean of x
## 497.8
A função t.test() realiza um teste-t considerando \(\alpha\) = 0.05.
O cálculo do p-valor considerando esse \(\alpha\) dependerá da \(H_A\) especificada.
O teste retorna também os intervalos de confiança para a \(H_A\) especificada.
Você verá que se o seu teste der um p<0.05, o valor especificado em mu estará fora do intervalo de confiança.
Lembre-se: você NÃO DEVE fazer testes considerando todas as \(H_A\), mas sim definir qual é sua \(H_A\) ANTES do teste
Uma escola está pensando se deve investir em uma nova técnica de ensino de redação. Durante um ano, uma turma de 30 alunos selecionados aleatoriamente dentre os alunos do terceiro ano tiveram aulas com essa nova técnica. Abaixo você tem o vetor com as notas desses alunos. A distribuição das notas é normal.
notas = c(739, 720, 701, 702, 701, 724, 674, 658, 713, 659, 715, 675, 701, 707, 700, 661, 728, 700, 742, 699, 660, 659, 690, 685, 719, 713, 701, 660, 676, 753)Ao fim do ano, a média dos alunos da escola que não fizeram parte da turma especial foi 650.
Considerando um alfa de 0.05, calcule se é possível rejeitar a \(H_0\) considerando que:
\(H_0\): \(\bar{X}\) = \(\mu\)
\(H_A\): \(\bar{X}\) > \(\mu\)
t.test(notas, mu=650, alternative = "greater")##
## One Sample t-test
##
## data: notas
## t = 9.7959, df = 29, p-value = 5.258e-11
## alternative hypothesis: true mean is greater than 650
## 95 percent confidence interval:
## 689.5365 Inf
## sample estimates:
## mean of x
## 697.8333
O grupo que fez aulas com a nova técnica teve um desempenho na prova significativamente maior que o restante da escola (t(29) = 9.79, p < 0.0001)
Exemplo de Hinton 2004
Um supermercado faz uma promoção para aumentar a média de compra de itens, que era de 25. Coleta-se uma amostra do número de itens comprados por 50 clientes que foram selecionados aleatoriamente. O vetor com esses valores encontra-se abaixo:
shoppingdata = c(30, 44, 19, 32, 25, 30, 16, 41, 28, 45, 28, 20, 18, 31, 15, 32, 40, 42, 29, 35, 34, 22, 30, 27, 36, 26, 38, 30, 33, 24, 15, 48, 31, 27, 37, 45, 12, 29, 33, 23, 20, 32, 28, 26, 38, 40, 28, 32, 34, 22)Considerando \(\alpha\) = 0.05, avalie se a propaganda surtiu o efeito desejado pelo supermercado.
t.test(shoppingdata, mu=25, alternative = "greater")##
## One Sample t-test
##
## data: shoppingdata
## t = 4.1941, df = 49, p-value = 5.724e-05
## alternative hypothesis: true mean is greater than 25
## 95 percent confidence interval:
## 28.0013 Inf
## sample estimates:
## mean of x
## 30
A distribuição dos dados é normal
As medidas são independentes (cada “fonte” (aluno, pacote de café, cliente etc.) contribui com apenas UM valor para a amostra)
Há homogeneidade de variância nos dados (não foram selecionados os pacotes mais pesados, ou os melhores alunos da escola, os clientes mais assíduos etc)
Trata-se de uma variável numérica contínua*
*Dados de contagem (como o do supermercado) não são variáveis contínuas. Geralmente NÃO é recomendado usar um teste-t para dados de contagem, porque a distribuição desses dados dificilmente tem uma distribuição normal. Para esse casos, há outras modelos de análise mais adequados. Algumas considerações sobre as limitações que advem de considerarmos dados de contagem como uma variável contínua podem ser achadas nesse post: https://www.theanalysisfactor.com/count-data-considered-continuous/
Digitar ? na frente do nome de uma função ou pacote abre o help do R, com informações sobre essa função ou pacote
?sd
?mean
?dplyrPara calcular a probabilidade de um t, usamos pt.
A função t.test() realiza um teste-t.
pt(t, df, lower.tail =) #retorna a probabilidade acumulada para um valor de t, considerando os graus de liberdade (df) e se é a partir da lower.tail ou não
t.test(dados, mu=X, alternative =) #retorna se a média de dados é diferente de X de acordo com a diferença definida em alternative ("two.sided", "less" ou "greater")